在游戲界面中點(diǎn)擊按鈕開始錄音,內(nèi)置的語音識別系統(tǒng)幾乎瞬間就能將語音轉(zhuǎn)換為文字,再點(diǎn)擊“發(fā)送”,一條應(yīng)用人工智能技術(shù)、由機(jī)器參與完成的文字消息就出現(xiàn)在了游戲屏幕上。整個(gè)過程可以像語音一樣實(shí)時(shí)與其他玩家交流,一點(diǎn)也不耽誤游戲操作和對局節(jié)奏。在網(wǎng)易旗下的多款游戲中,玩家們早就習(xí)慣了這項(xiàng)語音轉(zhuǎn)文字的功能。
它所依托的AI語音識別技術(shù),是由杭州網(wǎng)易數(shù)帆科技有限公司(簡稱“網(wǎng)易數(shù)帆”)自研開發(fā)的。
這一技術(shù)還應(yīng)用于網(wǎng)易旗下多個(gè)產(chǎn)品中。在網(wǎng)易云音樂中,基于語音識別技術(shù)獲取歌詞的時(shí)間軸信息可用于制作實(shí)時(shí)歌詞,以及在音視頻直播中對主播語音進(jìn)行識別,輔助進(jìn)行審核與分析;在網(wǎng)易新聞中,對用戶上傳的短視頻進(jìn)行語音識別,用于內(nèi)容審核;在有道詞典的語音翻譯功能中,對用戶的語音信息識別為文字信息再進(jìn)行翻譯……
20余年積淀,揚(yáng)起一艘數(shù)字光帆
2020年7月16日,在杭州網(wǎng)易數(shù)字+大會(huì)上,網(wǎng)易集團(tuán)旗下云計(jì)算和大數(shù)據(jù)品牌網(wǎng)易云宣布正式升級更名為“網(wǎng)易數(shù)帆”,將持續(xù)深化場景化服務(wù),并針對企業(yè)數(shù)字化需求,優(yōu)化和升級業(yè)務(wù)與戰(zhàn)略,聚焦基礎(chǔ)軟件領(lǐng)域業(yè)務(wù),以更主動(dòng)、更激進(jìn)的姿態(tài)打入企業(yè)數(shù)字化轉(zhuǎn)型服務(wù)這條To?B賽道。
幾個(gè)月后,在11月舉行的烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)上,網(wǎng)易數(shù)帆首次亮相“互聯(lián)網(wǎng)之光”博覽會(huì),展示了全鏈路數(shù)據(jù)生產(chǎn)力平臺、一站式軟件生產(chǎn)力平臺等云原生、大數(shù)據(jù)、人工智能領(lǐng)域的最新技術(shù)。目前,網(wǎng)易數(shù)帆已發(fā)展出四大業(yè)務(wù)線:云原生軟件生產(chǎn)力平臺網(wǎng)易輕舟,全鏈路數(shù)據(jù)生產(chǎn)力平臺網(wǎng)易易數(shù),多媒體智能開放平臺網(wǎng)易易智和全維度質(zhì)量效能平臺網(wǎng)易易測。其中,四大業(yè)務(wù)線中的網(wǎng)易易智主要以人工智能技術(shù)提升企業(yè)智能化水平。
作為網(wǎng)易技術(shù)的孵化器、人才的培養(yǎng)基地和市場的發(fā)動(dòng)機(jī),網(wǎng)易內(nèi)部設(shè)有杭州研究院,主要用于創(chuàng)新業(yè)務(wù)孵化、基礎(chǔ)技術(shù)平臺研發(fā)和前沿技術(shù)研究。網(wǎng)易數(shù)帆也是從這里孵化的,因此,盡管它是一個(gè)僅4歲的年輕品牌,背后卻有著網(wǎng)易集團(tuán)二十余年的互聯(lián)網(wǎng)技術(shù)積累。
據(jù)網(wǎng)易易智總經(jīng)理胡光龍介紹,網(wǎng)易是國內(nèi)最早一批研究并應(yīng)用AI技術(shù)的互聯(lián)網(wǎng)公司。2011年,網(wǎng)易郵箱推出了一項(xiàng)郵箱賬號安全功能——人臉識別,可通過攝像頭識別人臉信息,對用戶身份進(jìn)行認(rèn)證,防止郵箱賬號被盜,加強(qiáng)郵箱安全保障?!斑@其實(shí)就是比較早期的AI技術(shù)應(yīng)用案例,人臉識別功能的基礎(chǔ)是AI技術(shù)中涉及視覺方面的圖像識別?!焙恺埢貞浾f,“不過在當(dāng)時(shí),這一技術(shù)并沒有大規(guī)模地進(jìn)入移動(dòng)互聯(lián)網(wǎng)行業(yè),更沒有互聯(lián)網(wǎng)企業(yè)在用戶安全方面運(yùn)用人臉識別系統(tǒng)的先例,用人臉識別輔助產(chǎn)品安全是我們基于網(wǎng)易本身的產(chǎn)品線而做的嘗試?!?br/>
以數(shù)據(jù)為支撐,在場景內(nèi)打磨技術(shù)
胡光龍認(rèn)為,無論在什么時(shí)代,數(shù)據(jù)始終是人工智能領(lǐng)域中非常寶貴的資產(chǎn)。
海量的自有數(shù)據(jù)是網(wǎng)易數(shù)帆發(fā)展AI技術(shù)得天獨(dú)厚的優(yōu)勢。區(qū)別于很多企業(yè),網(wǎng)易的技術(shù)研發(fā)邏輯有著鮮明的特征——從業(yè)務(wù)需求、產(chǎn)品應(yīng)用出發(fā)。
比如研發(fā)語音識別系統(tǒng),最終還是為了解決網(wǎng)易內(nèi)部各項(xiàng)業(yè)務(wù)遇到的實(shí)際問題。從2013年開始,網(wǎng)易數(shù)帆(彼時(shí)還是網(wǎng)易杭州研究院)研發(fā)的語音識別系統(tǒng),經(jīng)歷了從最初原型系統(tǒng)到后期逐步完善優(yōu)化直至大規(guī)模應(yīng)用三個(gè)階段。
在早期,其語音識別系統(tǒng)在識別精度和識別效率上都不甚理想,隨著深度學(xué)習(xí)技術(shù)在人工智能領(lǐng)域的發(fā)展,網(wǎng)易多款產(chǎn)品內(nèi)的實(shí)際場景數(shù)據(jù)發(fā)揮了巨大作用,網(wǎng)易數(shù)帆在過去的基礎(chǔ)上開發(fā)了一套端到端的語音識別系統(tǒng)。
對于這套系統(tǒng)的評價(jià),胡光龍用了兩個(gè)關(guān)鍵詞——“漂亮的框架”和“質(zhì)的飛躍”。系統(tǒng)的好處不言而喻,能夠滿足網(wǎng)易業(yè)務(wù)發(fā)展尤其是國際化的需求。例如,一些全球同服的游戲,用戶語音轉(zhuǎn)換文字時(shí),會(huì)同時(shí)有中英日韓多種語言需要支持;語音翻譯應(yīng)用,目前需要先選擇語種再說話,實(shí)際應(yīng)用中容易選錯(cuò)導(dǎo)致無法識別……這些實(shí)際的業(yè)務(wù)場景需求,都驅(qū)動(dòng)著AI技術(shù)不斷演進(jìn)升級,朝著更成熟的方向發(fā)展。
自上線以來,網(wǎng)易語音識別系統(tǒng)已為游戲、教育、音樂、傳媒、企業(yè)服務(wù)領(lǐng)域的多個(gè)產(chǎn)品提供持續(xù)穩(wěn)定的服務(wù)支持。在電商智能客服等領(lǐng)域,經(jīng)過針對性的定制優(yōu)化,識別性能達(dá)到行業(yè)領(lǐng)先水平。
以開放的姿態(tài),推動(dòng)全行業(yè)智能化
網(wǎng)易一直擅長的,就是在大市場的細(xì)分領(lǐng)域站住腳跟。網(wǎng)易數(shù)帆在更名之后進(jìn)一步明確了自己的定位,在一個(gè)開放兼容的生態(tài)環(huán)境中,創(chuàng)造獨(dú)特的價(jià)值并與之兼容,沿著設(shè)定的核心業(yè)務(wù)線發(fā)展和深化。
在疫情催化之下,智能化技術(shù)飛速發(fā)展,企業(yè)數(shù)字化轉(zhuǎn)型需求也日益旺盛,為各行各業(yè)帶來新的發(fā)展痛點(diǎn)和全新的業(yè)務(wù)場景。企業(yè)如何降低技術(shù)門檻、轉(zhuǎn)型風(fēng)險(xiǎn)和成本?內(nèi)部系統(tǒng)多,數(shù)據(jù)孤島嚴(yán)重,數(shù)據(jù)如何支持決策?線上教育如何最大化利用師資力量,又能滿足學(xué)生高效復(fù)習(xí)和答疑的需求?這些問題,是金融、教育、物流等行業(yè)企業(yè)2020年在面臨數(shù)字化時(shí)遇到的“靈魂叩問”。網(wǎng)易數(shù)帆在幫助企業(yè)數(shù)字化轉(zhuǎn)型時(shí),會(huì)用AI技術(shù)或者基于這一技術(shù)的思路嘗試解決其他行業(yè)內(nèi)部的問題。
“人工智能領(lǐng)域的很多技術(shù)都可以在各行各業(yè)找到‘用武之地’?!焙恺堈f。比如在火熱的直播行業(yè),基于自學(xué)習(xí)語音識別技術(shù)、視頻分析及自然語言理解等技術(shù),可以對文本、圖像、視頻進(jìn)行分析和理解,用于視頻直播字幕、質(zhì)檢審核、內(nèi)容分發(fā)等業(yè)務(wù)場景,還能將文字信息轉(zhuǎn)化為聲音信息,用于虛擬主播、直播變聲場景等。
“直播行業(yè)還算是帶著互聯(lián)網(wǎng)基因,能與新技術(shù)快速融合,但同樣,傳統(tǒng)行業(yè)也需要AI技術(shù)賦能自己的業(yè)務(wù)。”胡光龍舉了一個(gè)簡單的例子,在絕大部分企業(yè)的報(bào)銷現(xiàn)狀中,普通員工報(bào)銷流程復(fù)雜繁瑣,財(cái)務(wù)人員日常工作單據(jù)處理量大、對賬繁瑣等,但用上OCR(光學(xué)字符識別)和NLP(自然語言處理)這些AI技術(shù)可以大幅度簡化流程?!爱?dāng)然,我們也仍然在探索,從小處著手,一步一步推進(jìn)各個(gè)行業(yè)的智能化?!?br/>
2020年7月以來,網(wǎng)易數(shù)帆已先后與浙商銀行、深圳證券交易所、好未來教育集團(tuán)、濟(jì)民可信集團(tuán)、國家超級計(jì)算中心濟(jì)南中心等多領(lǐng)域大型企業(yè)和機(jī)構(gòu)簽約,提供數(shù)字化轉(zhuǎn)型服務(wù)。
來源:每日商報(bào)